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jj 要 : [目的 /意义 ] 以 学 习 型 搜索 为 背景 ,探索 对 于 反映 用 户 感 知 任务 难度 具有 稳定 、 显著 影响 的 交互 行为 指标 。 [ 方 
法 “过程 ] 依 托 课堂 教学 开展 行为 实验 ,以 (信息 技术 应 用 》 课 程 学 生 为 研究 对 象 ,布置 5 项 搜索 任务 ,运用 Morae 
软件 进行 过 程 录制 , 共 收 集 39 名 学 生 的 170 条 有 效 检索 行为 数据 。 根 据 录 屏 数 据 和 任务 难度 感知 评价 数据 ,对 不 


同 难度 下 呈现 显著 差异 的 行为 指标 进行 分 析 。 结 合 


课题 组 在 2016 年 .2017 年 开展 的 两 项 实验 数据 ,以 及 已 有 相 


关 研 究 发 现 进行 横向 比较 ,归纳 不 同 任务 难度 下 行为 指标 呈现 显著 差异 的 稳定 性 。[ 结果 /结论 ] 最 终 获 得 具有 26 
项 行为 指标 的 稳定 行为 指标 体系 ,从 探索 式 搜索 过 程 及 行为 类 型 角度 对 用 户 在 困难 任务 下 的 行为 特点 进行 描述 ， 


并 指出 未 来 进一步 研究 的 方向 。 


pm 
q 检索 行为 ”交互 式 信息 检索 “实验 研究 


征 玖 联系 ,是 近年 来 交互 式 信息 检索 领域 的 研究 热点 
让" 。 任 务 难度 是 任务 的 重要 属性 之 一 *” ,任务 
难 拔 影响 着 检索 交互 行为 .检索 绩效 以 及 检索 体验 "。 
奏 尘 习 型 搜索 中 ,任务 难度 也 会 对 搜索 过 程 的 学 习 效 
果 ( 学 习 体验 产生 影响 中 。 难 度 一 般 是 指 项 目 ( 如 任 


务 < 题 目 等 ) 的 困难 容易 程度 ”。 用 户 对 搜索 任务 困难 
的 感知 可 能 来 自 搜索 过 程 多 方面 的 困难 , 与 搜索 交互 
过 程 中 的 用 户 ,任务 以 及 交互 过 程 都 有 关系 ,包括 理 
解 信息 需求 .开展 搜索 过 程 ,以 及 解释 结果 相关 性 等 
困难 "。 为 了 提升 用 户 的 搜索 绩效 .搜索 体验 和 学 
习 收 获 , 研 究 者 们 通过 探索 任务 难度 属性 与 检索 行 
为 的 关系 ,力图 构建 基于 检索 行为 的 任务 难度 预测 
模型 ,为 检索 系统 及 时 洞察 用 户 的 搜索 意图 、 困 境 进 
行 相应 干预 和 支持 提供 参考 ”” 。 检 索 行为 与 难度 
感知 关系 的 稳定 性 影响 着 基于 检索 行为 预测 任务 难 
度 感知 的 效果 。 

在 信息 搜索 任务 难度 方面 ,不 少 研究 者 已 经 开展 
了 一 系列 工作 。 本 研究 在 前 期 工作 中 开展 了 较为 系统 
的 综述 性 工作 ' ,可 以 看 到 ,不 少 研究 从 任务 困难 原 


因 、 网 络 信息 检索 ,以 及 特定 主题 ,媒体 类 型 资源 检索 
角度 ,探讨 了 不 同 任务 难度 下 检索 行为 的 特点 和 规律 
以 及 基于 行为 的 任务 难度 预测 工作 。 这 些 研 究 大 都 从 
查询 .浏览 点击、 保存 等 方面 选取 行为 指标 ,也 有 部 分 
研究 结合 了 检索 策略 ” ,搜索 路 径 “等 特征 ,还 有 研 
究 者 从 时 间 阶 段 角 度 综 合 考 虑 行为 特征 ”""。 这 些 研 
究 往 往 通 过 实验 室 研 究 的 方式 采集 数据 ,对 行为 数据 
和 难度 评价 数据 进行 关联 分 析 。 可 以 看 到 ,不 同 研究 
取得 的 发 现 并 不 完全 一 致 ,如 在 C. Liu 等 的 两 次 研究 
rmi , 均 发 现 用 户 在 简单 任务 中 查看 的 内 容 页 面 数 
量 高 于 困难 任务 ;而 在 J. Arguello” J. Gwizdka fI I. 
Spence ^ J. Kim ^ 的 研究 中 则 发 现 ,用 户 在 困难 任务 
中 会 查看 更 多 的 网 页 。 究 竟 哪 些 检索 行为 指标 有 助 于 
更 好 地 区 分 用 户 在 不 同 任务 难度 感知 下 的 状态 ? 这 会 
影响 到 后 期 对 于 基于 行为 进行 任务 难度 预测 的 可 靠 性 
和 稳定 性 。 目 前 还 较 少 有 研究 者 进行 多 项 实验 间 的 比 
较 工 作 , 因 此 ,本 研究 一 方面 结合 3 次 不 同 的 信息 检索 
行为 实验 , 另 一 方面 也 结合 同类 研究 的 发 现 进行 综合 
横向 比较 ,力图 发 现 更 为 稳定 的 ,对 于 任务 难度 感知 有 
显著 影响 的 行为 指标 ,为 后 期 开展 预测 提供 参考 和 


HE 
BE. 
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2 研究 设计 
2.1 研究 问题 
本 研究 以 学 习 型 搜索 为 背景 ,结合 现实 的 课程 教 

学 ,开展 检索 行为 实验 ,通过 收集 学 生 们 完成 搜索 任务 
的 行为 数据 和 任务 难度 感知 数据 ,分 析 显 著 影 响 难度 感 
知 的 行为 指标 ,并 且 与 不 同 实验 中 的 发 现 进行 比较 , 评 
价 指 标 稳 定性 。 具 体 研 究 问题 包括 :中 查询 点 击 、 鼠 
标 、 查 看 \ 时 间 类 检索 行为 特征 ,以 及 搜索 策略 特征 在 不 
同 任务 难度 感知 的 搜索 过 程 中 ,是否 存 在 显著 差异 ? DE 
中 发 现 的 显著 性 指标 在 不 同 的 实验 研究 中 ,哪些 行为 
指标 在 反映 任务 难度 感知 方面 具有 更 好 的 稳定 性 ? 
2.2 检索 行为 指标 

-本 研究 在 已 有 研究 基础 上 ,人 确立 了 查询 、 点 


V 


击 \、 鼠 标 、 查 看 和 时 间 5 类 检索 行为 ,同时 结合 R. Fi- 
del ”提出 的 检索 策略 类 型 ,从 操作 型 和 概念 型 两 个 方 
面 进行 划分 。 其 中 ,操作 型 策略 是 指 通过 调整 检索 系 
统 功 能 来 调整 检索 结果 集合 的 操作 ;概念 型 策略 是 指 
通过 修改 检索 提问 的 概念 含义 来 调整 检索 结果 集合 的 
操作 。 此 外 ,还 将 用 户 所 浏览 网 页 细 分 为 3 类 :输入 检 
索 词 前 的 “登录 页 ” ;显示 检索 结果 列表 的 “SERP 页 
Tii" ;显示 单一 检索 结果 摘要 或 全 文 的 "Doe 页 面 ”。 
此 ,本 研究 构建 的 检索 行为 指标 共计 7 类 特征 .50 项 
行为 指标 ,分别 是 ,查询 特征 (10 项 ) 点击 特征 (6 
项 ) 鼠标 特征 (9 项 ) .查看 特征 (6 项 ) 时间 特征 (14 
项 ) .操作 型 策略 (1 项 ) 以 及 概念 型 策略 (4 项 ) 。 具 体 
行为 指标 如 表 1 所 示 : 


R1 检索 行为 指标 体系 


级 指标 二 级 指标 


说 明 


询 特征 查询 次 数 

查询 总 长 度 

查询 平均 长 度 

首次 查询 和 平均 查询 长 度 之 
查询 项 总 数 

查询 平均 项 数 

唯一 查询 项 总 数 

查询 项 类 型 比 

查询 中 停止 词 词 数 
查询 中 唯一 停止 词 词 数 
i 击 特征 点 击 检索 结果 总 数 


点 击 检索 结果 平均 排名 


202304.0084 


翻 页 点 击 总 次 数 
平均 翻 页 点 击 次 数 
查询 中 点 击 次 数 


chinaXiv 


鼠标 特征 
鼠标 其 
鼠标 基 停 最 高 


SERP Jit [fij ELE 
鼠标 上 滑行 为 
BUT 
鼠标 上 当 
鼠标 移动 距离 (Pixels) 

查看 所 有 SERP 页 面 总 数 
查看 所 有 唯一 SERP 页 面 总 数 
查看 所 有 Doc 页 面 总 数 
查看 所 有 唯一 Doc 页 面 总 数 
查看 所 有 网 页 总 数 

查看 所 有 唯一 网 页 总 数 


SERP 页 面 


Doc 页 面 


Doc 页 面 


查看 特征 


输入 检索 词 进行 查询 的 次 数 
所 有 查询 提问 长 度 总 和 


每 次 查询 的 平均 提问 长 度 

首次 查询 长 度 与 平均 查询 长 度 之 差 
所 有 查询 词 总 和 

每 次 查询 的 平均 查询 词 个 数 

所 有 
查询 词 R 
查询 中 停止 词 总 和 


TIT 


查询 词 总 和 /唯一 查询 词 总 和 


查询 中 非 重复 停止 词 总 和 


在 SERP 页 面 
Eu 


点 击 检索 结果 的 次 数 总 数 


fi 检索 结果 在 所 有 检索 结果 中 的 排名 均值 


FE SERP 页 面 点 击 前 后 翻 页 的 次 数 总 数 


a 


nl 


日 


2n 
B 


日 


每 次 查询 在 SERP 页 
查询 中 没有 点 击 操作 标 0, 有 点 击 操作 标 1 
有 点 击 操作 查询 /总 查询 次 数 

鼠标 指针 进入 
次 查询 的 鼠标 悬 停 次 数 平 
其 停 检索 结果 在 所 有 检索 结果 中 排名 的 最 高 值 
享 检索 结果 在 所 有 检索 结果 中 排名 的 平均 值 


面 点 击 前 后 翻 页 的 次 数 平均 值 


检索 结果 周围 透明 的 浮动 框 中 并 有 明显 停顿 的 次 数 总 数 
fE 


在 SERP 页 面 的 鼠标 下 滑行 为 总 次 数 
在 SERP 页 面 的 鼠标 上 滑行 为 总 次 数 


在 Doc 页 


而 的 鼠标 下 滑行 为 总 次 数 


在 Doc 页 面 的 鼠标 上 滑行 为 总 次 数 


在 但 


E 务 过 程 中 鼠标 移动 总 距离 


查看 SERP 页 面 总 数 


查看 非 重 复 SERP 页 面 总 数 


查看 Doc HH AŽ 


= 
让 
5B 


查看 非 重 复 Doc 


查看 所 有 网 页 总 数 
查看 所 有 非 重复 网 页 总 数 
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一 级 指标 二 级 指标 


说 明 


(BERI) 


时 间 特 征 登录 页 平均 停留 时 长 
登录 页 停留 总 时 长 
SERP 平均 停留 时 长 
Doc 平均 停留 时 长 
网 页 平均 停留 时 长 
唯一 SERP 平均 停留 时 长 


唯一 Doc 平均 停留 时 长 
唯一 网 页 平均 停留 时 长 


SERP 停留 总 时 长 
Doc 停留 总 时 长 
网 页 停留 总 时 长 
文档 编辑 停留 总 时 长 
一 次 查询 平均 持续 时 长 
完成 任务 总 时 长 
检索 源 调整 

在 任务 描述 中 出 现 有 意义 查询 词 数 

没 在 任务 描述 中 出 现 有 意义 查询 词 数 
在 任务 描述 中 出 现 唯一 有 意义 查询 词 数 
没 在 任务 描述 中 出 现 唯一 有 意义 查询 词 数 


20D 任务 设计 

人 0 本 研究 从 全 校 通 识 教 育 课程 (信息 技术 应 用 ) 中 
报 茵 本 科 生 ,该 课程 主要 面向 低 年 级 本 科 生 进行 Ac 
NEE VBA 程序 设计 相关 知识 的 教学 。 笔 者 所 
在 课题 组 (以 下 简称 “课题 组 ) 收集 了 往年 多 届 学 4 


HT 


打开 检索 界面 至 输入 检索 词 点 击 检索 的 平均 停留 时 长 
打开 检索 界面 至 输入 检索 词 点 击 检索 的 总 停留 时 长 
SERP 页 面 的 平均 停留 时 长 

Doc 页 面 的 平均 停留 时 长 

网 页 的 平均 停留 时 长 

非 重复 SERP 页 面 的 平均 停留 时 长 

非 重复 Doc 页 面 的 平均 停留 时 长 

非 重复 网 页 的 平均 停留 时 长 

SERP 页 面 停留 总 时 长 

Doc 页 面 停留 总 时 长 

网 页 停食 总 时 
文档 编辑 总 时 
每 次 查询 的 平均 持续 时 间 
完成 任务 总 时 长 
用 户 在 检索 过 程 中 更 换 检索 源 的 次 数 

在 任务 描述 中 出 现 的 ,在 检索 中 使 用 的 有 意义 查询 词 数 
没有 在 任务 描述 中 出 现 的 ,在 检索 中 使 用 的 有 意义 查询 词 数 


Z, 
IN 
7 

IN 


没有 在 任务 描述 中 出 现 的 ,在 检索 中 使 用 


在 任务 描述 中 出 现 的 ,在 检索 中 使 用 的 非 重复 有 意义 查询 词 数 
的 非 重复 有 意义 查询 词 数 


在 课程 初期 普遍 关心 的 问题 ,并 结合 已 有 人 研究 的 任务 
设计 ,借鉴 教育 目标 分 类 -” 和 交互 式 检索 任务 认 知 复 
杂 度 特点 ,设计 理解 ,分 析 、 评 价 、 创 造 4 类、5 项 学 
习 型 搜索 任务 ,具体 任务 描述 如 表 2 Bron : 


X2 实验 任务 描述 


任务 描述 


对 间 需 要 多 入 ,如 何 制定 备考 计划 ? 请 你 在 查询 相关 资料 


ae 理解 类 Access 是 怎样 一 个 工具 ,最 新 版 本 是 什么 ?最 新 版 本 与 老 版 本 相 比 增加 了 哪些 新 功能 ? 请 你 在 查阅 相关 信息 后 ,给 出 说 明 
rds 有 同学 不 清楚 如 何在 苹果 操作 系统 下 安装 Access ,请 你 在 查阅 相关 信息 后 ,给 他 一 些 建议 
评价 类 国家 计算 机 二 级 考试 的 科目 包括 Access C 语言 .Python Office 等 , 想 知道 考 哪 一 科目 对 自己 更 有 必要 ,为 什么 ? 请 你 在 查询 相关 资料 后 ， 
结合 自身 实际 需求 , 谈 谈 你 的 看 法 
创造 类 如 果 计 划 报考 国家 计算 机 二 级 考试 Access 科目 , 想 了 解 考试 内 容 有 哪些 ,备考 
后 ,做 一 个 备考 说 明文 档 , 保 存 为 WORD 文档 
本 学 期 信息 技术 应 用 课程 主要 包括 数据 库 原理 程序 设计 两 大 知识 内 容 。 


常 计 算 机 软 硬 件 知识 也 不 是 很 熟悉 ,担心 这 些 方面 薄弱 的 话 会 影响 信息 技术 应 


因为 感觉 涉及 很 多 数据 ,有 些 同学 会 担心 自己 数理 成 绩 一 般 \ 日 


课程 的 学 习 。 请 你 查阅 相关 资料 后 , 谈 谈 你 的 看 法 ,认为 


是 否 有 影响 ? 如 果 有 影响 ,会 产生 什么 影响 ? 采用 什么 方法 可 以 避免 负面 影响 ? 如 果 没 有 影响 ,可 以 有 哪些 方法 来 提升 学 习 效 果 ? 也 请 


记录 在 文档 中 进行 说 明 


2.4 数据 收集 

本 次 实验 ( 即 第 3 次 实验 ) 收 集 于 2020 年 春季 的 
《信息 技术 应 用 课程 》, 在 第 一 次 课程 的 时 候 以 作业 形 
式 发 放 给 学 生 ,学 生 使 用 Morae 软件 记录 信息 检索 E 
业 书 写 的 完成 过 程 。 在 完成 作业 前 ,使 用 5 SUE TUE 
量 表 收 集 学 生 们 对 任务 的 难度 感知 熟悉 度 、 兴 趣 度 等 
信息 。 每 一 项 检索 任务 完成 后 ,同样 采用 5 DUE vU 
量 表 收 集 学 生 对 任务 难度 .困难 原因 及 检索 绩效 (包括 
相关 性 有 用 性 \ 信 心 程度 成 功 感 ) 的 感知 。 这 次 实验 


中 收集 到 39 名 学 生 提交 的 作业 ,男生 10 人 ,女生 29 
人 。 其 中 ,36 人 来 自 政府 管理 学 院 ,2 人 来 自 经 济 与 工 
商 管理 学 院 ,1 人 来 自 法 学 院 。 并 且 ,36 人 为 大 一 新 
生 ,2 人 为 大 二 学 生 ,1 人 为 大 三 学 生 。 所 有 学 生 均 使 
用 个 人 电脑 对 搜索 过 程 进行 Morae 录制 ,由 于 Morae 
软件 卡 顿 .重启 导致 部 分 任务 过 程 记 录 不 完整 ,实际 收 
集 的 有 效 检索 行为 数据 为 170 条 。 

因为 Morae 录 频 问题 ,SERP 页 面 鼠 标 下 滑行 为 和 
上 滑行 为 .Doc 页 面 鼠 标 下 滑行 为 和 上 滑行 为 .鼠标 移 
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动 距 离 .文档 编辑 停留 总 时 长 6 项 行为 指标 存在 一 定 
的 缺失 。 但 实验 中 行为 变量 缺失 率 最 高 为 32.35% , 低 
于 缺失 值 阔 值 ” ,因此 ,根据 多 种 缺失 数据 处 理 方法 
的 对 比分 析 ” ,本 研究 选取 A. P. Dempster 等 ”所 提 
出 EM 算法 ,对 因为 录 频 软件 问题 导致 的 缺失 行为 进 
行 变量 填充 。 

此 外 ,本 研究 还 综合 运用 了 课题 组 前 期 的 两 次 实 
验 研究 工作 :@ 实 验 一 ”在 2016 年 开展 ,以 任务 复杂 
程度 ”为 依据 ,设计 了 事实 .探索 .抽象 3 类 5 项 任务 ， 
随机 招募 30 名 在 校 学 生 进 行 实验 室 研 究 。 被 试 中 有 
男生 5 人 ,女生 25 人 。 其 中 ,本 科 生 8 人 ,研究 生 22 
人 。 学 生来 自 政府 管理 学 院 Ji^ bo .生物 科学 学 院 
等 6 个 院 系 。@ 实 验 二 "在 2017 年 开展 ,根据 教育 目 
标 分 类 法 后 ,设计 了 记忆 ,理解 ,分析 ,评价 .创造 5 类 
5 ILS ,随机 招募 30 名 在 校 学 生 开 展 实验 室 研究 。 
0 E 


人 ,研究 生 14 人 , 共 来 自 21 个 学 院 。 在 这 两 次 实验 
中 , 均 收集 了 用 户 在 任务 完成 前 后 对 任务 难度 感知 的 
评价 ,以 及 搜索 过 程 的 行为 数据 。 本 次 研究 利用 3 次 
实验 数据 ,以 及 同类 研究 的 发 现 进 行 横向 比较 分 析 , 力 
图 发 现在 不 同 实验 任务 .被 试 构 成 下 ,影响 任务 难度 感 
知 的 更 为 稳定 的 行为 指标 。 为 使 表述 简洁 ,以 “实验 
一 ” 指 代 2016 年 开展 研究 ,以 “实验 二 ” 指 代 2017 年 开 
展 研究 ,以 “实验 三 ” 指 代 本 文 所 开展 最 新 研究 。 


3 数据 分 析 与 讨论 


3.1 任务 难度 感知 基本 情况 

以 用 户 在 检索 后 对 任务 困难 程度 的 评分 作为 用 户 
感知 任务 难度 的 判断 依据 ,在 总 体 情 况 方面 ,3 次 实验 
中 的 任务 难度 水 平 相当 ,3 次 实验 任务 难度 分 布 及 总 
体 均 值 和 标准 差 情 况 如 表 3 所 示 : 


表 3 3 次 实验 任务 检索 后 难度 感知 评价 


Co 实验 编号 任务 难度 分 布 难度 评分 
" 
eR 3.50 
3.10 
e 3.00 2.80 277 
eo 2.53 
N 2.50 
e bi 2 o w3 MEAN =2. 59 
QN 02016) gi 150 SD =1.037 
E. m 
> 1.00 
LI es 
c 0.50 
人 0.00 
c 任务 2 任务 5 任务 3 任务 4 任务 1 
g= 4.00 
C 3.63 
o 3.50 323 
3.00 
2.53 
m 250 
实验 二 (2017) a 2.00 Y MEAN -2. 83 
W 150 SD -1.079 
1.00 
0.50 
0.00 
任务 5 任务 4 任务 3 任务 2 任务 1 
400 
me 3.47 
3.09 A 
3.00 
262 si 
i 250 
Ed MEAN -2.92 
实验 三 (2020 da 200 i 
o ) Ui s SD =0. 955 
1.00 
0.50 
0.00 
任务 5 任务 4 任务 3 任务 2 任务 1 
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3.2 显著 性 行为 指标 分 析 
在 3 次 实验 中 选取 检索 后 任务 难度 评价 ,将 评分 


分 值 为 4 与 5 归 为 困难 任务 ,3 A 


P 等 困难 


T 


,1 与 2 


归 为 简单 任务 。3 次 实验 数据 均 采 用 Kruskal-Wallis H 
表 4 不 同 任务 难度 感知 下 差异 显著 的 检索 行为 指标 对 比分 析 


实验 一 (2016) 


检验 方法 ,以 
异 及 其 显著 人 


比较 在 不 同 难 度 任务 中 ,月 


昌 户 检索 行为 差 


任务 难度 下 呈现 差异 


实验 二 (2017) 


ien 


E. de 4 列 出 了 3 次 不 同 实验 中 ,在 不 同 
电车 的 行为 指标 数值 情况 。 


实验 三 (2020 ) 


行为 指标 简单 中等。 困难 Ss。 简单 中 等 困难 sig 简单 中 等 困难。 

N=79 N=36 N=35 N=56 N=50 N=44 N=58 N=60 N=52 
查询 次 数 2.755 4.08 7.31 0.00 4.11 6.54 625 0.00 2.6 4.12 442 0.00 
查询 总 长 度 13.39 16.58 26.97 0.00 18.00 39.36 36.03 0.00 20.16 39.88 39.44 0.00 
查询 平均 长 度 4.80 3.94 3.63 0.44 4.56 5.75  Á 5.55 09.0 7.92 10.43 9.98 0.01 
查询 项 总 数 6.92 8.50 12.89 0.00 8.68 19.68 17.86 0.00 12.55 21.60 22.08 0.00 
唯一 查询 项 总 数 3.29 3.31 3.86 0.68 4.50 7.14 6.30 0.00 7.97 10.70 10.92 0.00 
查询 项 类 型 比 2.08 2.63 4.07 0.00 1.97 2.66 2.68 0.00 143 1.96 2.00 0.00 
点 击 检索 结果 总 数 1.62 3.31 3.94 0.00 445 6.36 5.05 0.00 3.16 5.35 4.73 0.00 
翻 页 点 击 总 次 数 0.43 0.81 0.80 | 0.34 1.36 1.52 1.04 | 0.50 0.03 0.17 0.33 0.03 
平均 翻 页 点 击 次 数 0.13 0.20 0.17 0.47 0.34 0.34 0.39 0.54 0.02 0.03 012 003 
查询 中 点 击 次 数 0.85 1.33 1.94 0.00 236 3.06 261 0.0 202 288 277 0.01 
查询 点 击 百分比 33.26% 36.20% 29.68% 0.73 62.98% 55.81% 47.52% 0.04 84.80% 73.91% 66.80% 0.01 
鼠标 悬 停 总 次 数 - - - - 10.34 17.62 13.93 0.00 5.55 10.55 10.06 0.00 
鼠标 悬 停 最 高 排名 - - - - 7.48 8.96 9.33 003 514 703 7.17 0.00 
鼠标 悬 停 平 均 排 名 - - - - - - - - 2.82 3.42 3.45 0.02 
SERP 页 面 鼠 标 下 滑行 为 3.24 6.33 7.37 0.00 - - - s 52.26 147.72 72.31 0.00 
SERP Jt ifii LER E18 432 1.59 3.61 3.89 0.00 = 2 z i 21.81 58.15 40.90 0.00 
Doc 页 面 鼠 标 下 滑行 为 0.94 167 3.31 0.00 - - - - 193.66 570.47 267.37 0.00 
Doc 页 面 鼠 标 上 滑行 为 0.53 106 1.97 0.00 - z = - 78.14 200.17 105.48 0.01 
查看 所 有 SERP 页 面 总 数 4.61 7.53 12.57 0.00 8.21 12.74 11.39 0.00 4.55 8.78 8.02 0.00 
查看 所 有 唯一 SERP 页 面 总 数 3.19 5.03 8.31 0.00 5.04 7.56 7.30 0.00 291 4.52 4.98 0.00 
查看 所 有 唯一 Doc 页 面 总 数 1.46 3.14 431 0.00 4.02 6.48 5.70 0.00 3.26 5.42 5.00 0.00 
查看 所 有 网 页 总 数 6.24 11.17 18.00 0.00 13.07 20.90 18.68 0.00 12.41 19.12 17.98 0.00 
查看 所 有 唯一 网 页 总 数 4.66 8.17 12.63 0.00 9.05 14.04 13.00 0.00 6.17 9.93 9.98 0.00 
登录 页 停留 总 时 长 24.46 25.28 54.901 0.00 35.91 46.52 55.48 0.18 34.43 55.55 65.73 0.00 
SERP 平均 停留 时 长 18.86 18.93 14.54 0.21 19.21 19.87 20.67 0.18 10.61 15.61 16.32 0.03 
唯一 SERP 平均 停留 时 长 26.28 25.55 21.97 0.30 33.30 33.55 32.18 0.58 18.61 30.33 27.84 0.01 
SERP 停留 总 时 长 73.49 120.36 160.23 0.00 126.89 221.38 200.36 0.00 52.58 122.29 122.46 0.00 
网 页 停留 总 时 长 95.49 164.06 240.86 0.00 240.43 438.34 399.45 0.00 238.88 388.20 399.74 0.01 
文档 编辑 停留 总 时 长 Š - - - - - - - 253.43 354.20 368.50 0.03 
完成 任务 总 时 长 95.49 164.06 240.86 0.00 240.43 438.34 399.45 0.00 563.95 818.01 898.40 0.00 
检索 源 使 用 个 数 0.46 078 251 0.00 1.45 1.64 1.70 0.59 1.22 1.30 1.50 0.05 
在 任务 描述 中 出 现 有 意义 查询 词 数 5.85 5.94 9.40 0.05 6.25 11.10 11.98 0.00 8.36 14.98 15.04 0.00 
没 在 任务 描述 中 出 现 有 意义 查询 词 数 0.92 2.14 297 0.02 205 6.82 4.7 0.0 02.00 3.70 4.00 0.01 
在 任务 描述 中 出 现 唯 一 有 意义 查询 词 数 2.52 1.97 1.89 0.61 2.71 3.06 3.30 0.26 4.88 6.30 6.29 0.00 


注 :Sig<0. 05 表明 在 0.05 水 平 下 差异 显著 ,以 加 粗 字体 显示 ;实验 一 ,实验 二 存在 部 分 指标 数 


由 3 次 实验 数据 分 析 可 知 :中 在 查询 类 的 6 项 指 
标 中 ,有 4 项 指标 在 3 次 实验 中 都 体现 出 了 不 同 难度 
任务 下 的 显著 差异 , 均 表 现 为 高 难度 任务 下 行为 次 数 
显著 高 于 低 难 度 任务 。 近 在 点 击 类 的 5 项 指标 中 有 2 


值 记录 缺失 , 记 为 *-” 


项 指标 ,呈现 显著 差异 ,同样 表现 为 高 难度 任务 下 行 ; 


次 数 显著 高 于 低 难 


度 任务 ,不 过 对 于 


P 等 难度 和 高 难 


222: 


BE ,这 两 类 任务 之 间 的 行为 差异 并 不 总 是 显著 ,但 是 简 
单 任务 与 非 简单 任务 之 间 的 差异 显著 。(3) 在 鼠标 类 的 
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7 项 指标 中 ,前 两 次 实验 部 分 行为 数据 不 完整 ,从 实验 
一 与 实验 三 的 比较 ,以 及 实验 二 和 实验 三 的 比较 来 看 ， 
尽管 这 些 指标 均 呈 现 不 同 任务 难度 下 的 差异 ,但 是 在 
表现 上 并 不 完全 相同 ,如 中 等 困难 的 任务 在 "Doc 页 面 
鼠标 下 滑行 为 "指标 上 显著 高 于 简单 困难 任务 ,并 不 
完全 遵循 从 简单 到 困难 的 递增 变化 规律 。 外 在 查看 类 
的 5 项 指标 中 , 均 在 3 次 实验 中 体现 了 不 同 难度 任务 
下 的 显著 差异 ,简单 任务 下 的 行为 次 数 要 显著 低 于 中 
等 .困难 任务 。 名 在 时 间 类 的 7 项 指标 中 ,3 项 指标 体 
现 出 了 不 同 难度 任务 下 的 显著 差异 , 均 表 现 为 困难 任 
务 下 持续 时 间 长 度 显著 高 于 简单 任务 。@@ 在 检索 策略 
的 4 项 指标 中 ,2 个 指标 在 3 次 实验 中 都 体现 出 了 不 同 
难度 任务 下 的 显著 差异 ,也 表现 为 困难 任务 下 使 用 的 
途 务 描述 中 有 意义 查询 词 的 个 数 、 未 出 现在 任务 描述 
中 的 有 意义 查询 词 的 个 数 都 要 显著 高 于 简单 任务 。 


任务 难度 感知 下 的 显著 差异 的 指标 称 为 稳定 性 指标 ， 
其 他 均 归 为 不 稳定 行为 指标 并 进行 剔除 ,最 后 获得 26 
项 稳定 行为 指标 。 这 些 指 标 意味 着 在 不 同 的 实验 任务 
情境 下 具有 反映 用 户 难度 感知 差异 的 特点 。 同 时 ,本 
研究 还 将 26 项 指标 与 已 有 研究 文献 及 发 现 进行 横向 
比较 ,将 任务 难度 感知 对 检索 行为 影响 方向 一 致 的 指 
标 称 为 共性 指标 ,不一致 的 指标 称 为 差异 指标 ,未 出 现 
在 已 有 研究 中 的 指标 称 为 新 增 指标 。 

为 了 分 析 检 索 行 为 指标 与 探索 式 搜索 过 程 的 关 
系 , 本 研究 借鉴 R. W. White 等 “ 提出 的 浏览 、 集 中 
检索 两 个 基本 过 程 , 将 检索 行为 归 为 探索 式 浏 览 和 集 
中 式 检索 两 类 ,其 中 探索 式 浏览 主要 包含 发 现 .学 习 与 
调查 ;集中 检索 主要 包括 提问 词 的 再 形成 、 结 果 分 析 
等 。 如 表 5 所 示 ,26 项 检索 行为 指标 归 为 检索 初期 检 
索 过 程 两 类 ,其 次 又 将 检索 过 程 分 为 集中 式 检索 与 探 
索 式 浏览 两 类 。 


Oren 过 上 述 比较 ,在 3 次 不 同 实验 中 表现 出 不 同 
© 表 5 稳定 行为 指标 体系 
ero HERB 行为 指标 相关 文献 特征 类 型 
GB 期 登录 页 停留 总 时 长 新 增 指标 时 间 特 征 
T 集中 检索 查询 次 数 共性 指标 9.11.27 -3] 查询 特征 
d 查询 总 长 度 共性 指标 [27] 
N 查询 项 总 数 共性 指标 [9,11,28] 
~ 唯一 查询 项 总 数 共性 指标 [9,11] 
nm 查询 项 类 型 比 共性 指标 [9] 
>< 点 击 检索 结果 总 数 # 性 指标 [9,30 -31] 点 击 特征 
E 翻 页 点 击 总 次 数 共性 指标 [91 
i= 查询 中 是 否 有 点 击 共性 指标 [91 
EI 查询 点 击 百 分 比 共性 指标 [91 
o 检索 源 使 用 个 数 新 增 指标 检索 策略 
在 任务 描述 中 出 现 有 意义 查询 词 数 新 增 指标 
没 在 任务 描述 中 出 现 有 意义 查询 词 数 新 增 指标 
检索 过 程 在 任务 描述 中 出 现 唯一 有 意义 查询 词 数 新 增 指标 
探索 浏览 鼠标 悬 停 总 次 数 共性 指标 [9] 鼠标 特征 
EU E Des M 共性 指标 [9] 
EU E DEEP 新 增 指标 
查看 所 有 SERP 页 面 总 数 共性 指标 [01 查看 特征 
查看 所 有 唯一 SERP 页 面 总 数 共性 指标 [11] 
查看 所 有 唯一 Doc 页 面 总 数 差异 指标 [1 
查看 所 有 网 页 总 数 共性 指标 116] 
查看 所 有 唯一 网 页 总 数 性 指标 05 -16] 
SERP 停留 总 时 长 共性 指标 [1123] 时 间 特 征 
网 页 停留 总 时 长 新 增 指标 
文档 编辑 停留 总 时 长 新 增 指标 


完成 任务 总 时 长 


性 指标 [59,11 ,15 -16,28,31 - 32] 
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由 表 5 可 以 看 出 : 

(1) 从 任务 开始 初期 用 户 对 任务 的 解读 和 检索 策 
略 的 构思 过 程 来 看 ,在 困难 任务 中 用 户 在 检索 登陆 页 
停留 时 间 ( 即 从 进入 检索 界面 到 输入 检索 词 点 击 进行 
检索 的 时 间 ) 显著 高 于 简单 任务 ,反映 出 用 户 需要 更 多 
时 间 来 酝酿 和 思考 检索 策略 。C.C. Kuhlthau'” 曾 在 
ISP 模型 中 也 指出 ,任务 执行 指出 ,用 户 对 于 检索 目标 
都 存在 着 模糊 的 不 确定 感 。 当 用 户 感觉 自己 可 能 缺乏 
所 需 的 领域 知识 .不 太 擅 长 时 ,会 加 大 任务 的 难度 感 ， 
并 付出 更 多 的 努力 去 解决 这 个 问题 。 因 此 ,在 任务 
描述 理解 .联系 已 有 的 领域 知识 .选取 关键 词 , 构 造 检 
RE .选择 信息 源 ,项 期 检索 结果 等 方面 可 能 会 耗费 更 
长 的 时 间 。 关 于 “登录 页 停留 总 时 长 ”指标 ,在 已 有 研 
完 中 有 类 似 的 指标 ,但 不 完全 相同 ,本 研究 定义 “登录 
玖 为 输入 检索 词 前 的 检索 界面 ,而 本 Arguello ”研究 
sa 定义 “加 载 页 "为 点 击 检索 结果 后 打开 页 面 的 时 间 ， 


Atte. 
< 二 (2) 从 任务 检索 执行 过 程 来 看 ,用 户 会 不 断 进行 
到 类 试 ,并 且 在 查看 .分析 .对 比 检索 结果 中 进行 选 


的 信息 源 类 型 更 多 样 , 其 中 既 包 括 不 同 的 平台 数 , 也 包 
括 在 同一 个 平台 的 不 同 功能 区 。 而 对 于 概念 型 策略 而 
言 ,用 户 在 处 理 困 难 任务 时 ,会 更 细致 地 从 任务 描述 中 
抽取 检索 词 ,并 且 在 搜索 过 程 中 受到 启发 去 提出 更 多 
的 .未 在 任务 描述 中 提 到 的 检索 词 。 这 些 新 的 检索 词 
既 可 能 来 自用 户 对 结果 的 学 习 或 发 散 ,也 可 能 来 自 系 
统 推荐 资源 。X.， Nu 5 D. Kelly ^ 对 用 户 使 用 具有 
查询 建议 功能 的 检索 系统 情况 进行 探究 ,结果 表明 , 参 
与 者 将 查询 建议 纳入 其 搜索 速度 非常 快 ,对 于 专业 知 
识 经验 较 少 的 用 户 会 使 用 更 多 的 查询 建议 及 保存 更 多 
文档 。 参 与 者 在 更 困难 的 任务 中 ,也 会 更 多 使 用 查询 
建议 。 通 过 查询 扩展 、 查 询 词 推荐 .分 面 检索 等 方式 ， 
都 有 助 于 帮助 用 户 获得 更 多 启发 ,降低 搜索 寻找 新 词 
的 困难 。 

其 次 ,在 探索 浏览 方面 ,12 项 行为 指标 对 于 区 分 
不 同 任务 难度 具有 显著 性 ,其 中 8 项 共性 指标 ,3 项 新 
增 指标 ,1 项 差异 指标 。 共 性 指标 表明 , 当 用 户 完 成 困 
难 任务 时 ,查看 结果 的 最 大 深度 ,在 可 能 有 用 的 信息 上 
的 鼠标 悬 停 次 数 、 对 所 有 SERP 页 面 \ 唯 一 SERP 页 面 
的 查看 次 数 ,以 及 网 页 总 数 和 唯一 网 页 总 数 都 要 显著 


Fn 这 一 过 程 中 ,多 项 研究 都 发 现 了 在 困难 任务 ,简单 
E 罗 之 间 具 有 显著 性 差异 的 行为 指标 。 


Al 
C 


首先 ,在 集中 检索 方面 ,13 项 行为 指标 对 于 区 分 
不 柯 任 务 难度 具有 显著 性 ,其 中 9 项 为 共性 指标 ,4 项 
沪 秩 增 指标 。 当 用 户 应 对 更 困难 任务 时 ,查询 行为 点 
击 得 为 次 数 显著 高 于 简单 任务 。 用 户 在 困难 任务 下 ， 
会 党 试 对 检索 式 不 断 进行 调整 . 重 构 ,使 用 不 同 的 检索 
词 (B 会 更 多 ,结果 点 击 次 数 . 翻 页 次 数 以 及 查询 中 产生 
点 击 的 百分比 都 会 显著 高 于 在 简单 任务 下 的 表现 , 表 
明 用 户 会 查看 更 多 的 信息 ,并 且 在 查询 过 程 中 产生 点 
击 的 情况 也 更 频繁 。 类 似 的 ,A，Inthiran 等 J. Ar- 
guello” JJ. Liu axi JA: Aula? . O0. Dan?! 都 曾 发 
现 ,用 户 在 应 对 更 困难 的 任务 时 ,查询 次 数 显著 高 于 更 
为 简单 任务 的 情况 ;A. Inthiran BM xj Arguello ^ aJ. 
Liu 45 A. Aula ”表明 ,困难 任务 中 的 查询 长 度 、 查 


高 于 简单 任务 ,并 且 SERP 停留 时 长 ,任务 总 时 长 也 会 
显著 高 于 简单 任务 。 这 些 行为 都 是 用 户 进行 结果 研 
EE. ve .结果 相关 性 判定 的 基本 活动 。 可 见 ,在 结果 
页 面 的 更 长 时 间 阅 读 ,查看 更 多 不 一 样 的 结果 ,这 些 行 
为 可 能 都 预示 着 用 户 此 时 对 任务 存在 困难 感 。 类 似 
地 ,J. Arguello” , X. Hu 和 N. Kando ^" ,L. Fraser 与 
C. Locatis ”都 曾 发 现 , 在 困难 任务 中 用 户 的 鼠标 点 击 
次 数 显著 增高 ;J，Arguello ”研究 中 发 现 用 户 鼠 标 、 滚 
动 条 操作 在 困难 任务 中 操作 次 数 更 多 ;J，Arguello ” 、 
J. Liu 4$" X. Hu 和 N. Kando?" ,D. Hienert 45?! 、 
J. Gwizdka 5 I. Inthiran dU J. 
Kim" 等 均 曾 发 现 ,用 户 在 困难 任务 中 花费 的 时 间 要 
明显 多 于 简单 任务 。 

在 共性 指标 基础 上 ,本 研究 新 增 3 项 指标 。 其 中 ， 
“鼠标 县 停 平 均 排名 ”指标 是 综合 前 期 研究 优化 所 得 ， 


=} 


Spence? , A. 


询 词 个 数 都 要 高 于 简单 任务 的 情况 。 并 且 , 用 户 在 困 
难 任务 中 表现 为 会 尝试 更 多 的 检索 调整 。J. Kim 的 研 
究 也 发 现 ,在 困难 任务 中 用 户 的 检索 调整 次 数 显 著 提 
升 "9 。 随 着 任务 复杂 度 的 提升 ,检索 调整 的 操作 数 也 
会 随 之 增加 。 

除了 具体 检索 行为 指标 ,本 研究 还 从 检索 策略 上 
新 增 了 4 项 指标 ,并 且 均 具有 区 分 任务 难度 的 作用 。 
其 中 ,操作 型 策略 中 主要 体现 为 困难 任务 下 ,用 户 使 用 


该 指标 的 显著 结果 表明 ,在 困难 任务 中 用 户 会 对 检索 
结果 列表 进行 更 深度 地 浏览 ,而 非 仅仅 浏览 结果 列表 
中 排名 靠 前 的 检索 结果 。 此 外 ,本 研究 对 SERP 页 面 
和 Doc 页 面 停留 时 间 进 行 了 区 分 ,综合 统计 了 所 有 网 
页 的 “网 页 停留 总 时 长 ”, 该 指标 的 显著 结果 同样 反映 
出 用 户 在 对 搜索 内 容 浏览 .理解 .学 习 方 面 所 付出 的 努 
力 。 同 时 ， 文 档 编辑 停留 总 时 长 "是 针对 本 研究 开展 
的 学 习 型 搜索 所 新 增 的 指标 ,用 以 反映 用 户 在 对 信息 
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整合 .汇总 基础 上 完成 任务 目标 所 花费 的 认 知 努力 , 同 
样 表现 出 在 困难 任务 下 ,用 户 会 耗费 比 简单 任务 更 长 
的 时 间 精 力 。 

在 探索 浏览 方面 还 有 1 项 差异 指标 , 即 “ 查 看 所 有 
唯一 Doc 页 面 总 数 ”,J Liu 25 发现 “查看 所 有 了 唯一 
Doc 页 面 总 数 ” 随 任务 难度 增加 呈 递 减 趋 势 。 对 比 两 
次 实验 任务 设计 ,本 课题 组 所 开展 的 实验 ,或 者 要 求 用 
户 回答 有 关 问 题 ,或 者 要 求 其 完成 调研 报告 撰写 ,这 对 
于 查看 Doc 页 面 的 需求 更 高 ,而 J Arguello” 和 JJ Liu 
等 加 的 研究 中 仅 要 求 用 户 保 存 或 标记 相关 结果 ,这 可 
能 是 导致 实验 结果 差异 的 原因 。 

根据 上 述 讨论 可 知 , 本 研究 通过 多 次 实验 比较 ,以 
及 与 同类 研究 的 横向 比较 ,总 结 了 在 不 同 研究 条 件 下 
对 手 任 务 难度 感知 判断 有 显著 作用 的 行为 指标 ,有 助 

揭示 任务 难度 感知 与 检索 行为 之 间 更 为 稳定 的 关 
系 s 为 进一步 量化 映射 及 研究 开展 商定 基础 ,也 能 够 为 
属性 预测 研究 的 行为 特征 选取 、 权 重 设计 
提 覆 参考 。 同 时 ,结合 探索 式 搜索 过 程 的 典型 过 程 分 
释 这 些 行为 反映 任务 难度 感知 提供 理论 支持 。 


六 


加 本 研究 综合 了 文献 调研 和 前 期 研究 基础 ,依托 课 
党 席 学 开展 实验 研究 ,以 《信息 技术 应 用 》 课 程 学 生 ; 
研究 对 象 ,利用 Morae 软件 通过 远程 方式 开展 检索 行 
Apos Jic 8] 39 名 学 生 的 170 条 有 效 检索 行为 数 
据 22 根 据 录 屏 数据 和 任务 难度 感知 评价 数据 ,对 不 同 
难度 下 呈现 显著 差异 的 行为 指标 进行 分 析 。 并 且 , 结 
(litte 2016 年 .2017 年 开展 的 实验 研究 结果 ,以 
及 与 已 有 相关 研究 的 发 现 进 行 综合 比较 ,总 结 了 26 项 
对 于 区 分 任务 难度 感知 有 影响 的 显著 性 指标 在 不 同 研 
究 中 的 结果 。 

在 社会 科学 实验 研究 中 ,重复 和 再 现 相同 的 实验 
环境 、 条 件 面临 许多 困难 和 挑战 ,如 实验 招募 的 参与 者 
存在 主观 性 和 个 体 差 异 , 作 为 实验 刺激 的 任务 设计 在 
引发 参与 者 难度 感知 程度 等 方面 ,都 存在 精确 衡量 和 
控制 的 难度 。 但 经 过 3 次 实验 结果 的 比较 可 以 看 到 ， 
通过 五 级 量 表 衡量 任务 主观 难度 感知 ,以 及 通过 实验 
室 统一 机 器 进行 实验 和 使 用 个 人 计算 机 进行 实验 , 依 
然 能 够 揭示 出 在 不 同 实验 任务 设计 下 具有 高 稳定 性 的 
检索 行为 指标 ,其 在 不 同 任务 难度 感知 下 呈现 显著 差 
异 , 对 于 更 稳定 地 进行 任务 难度 感知 预测 莫 定 了 基础 。 
同时 ,未 来 研究 还 可 以 更 深入 地 探讨 影响 指标 稳定 性 
的 因素 ,探索 不 同 特 征 组 合 方式 ,或 结合 时 间 维 度 , 控 


索 基 于 检索 行为 的 难度 预测 建 模 策 略 和 方法 。 并 且 ， 
未 来 研究 可 结合 具体 检索 情境 特点 ,建立 用 户 任 务 难 
度 感 知 与 多 层次 ,不同 颗粒 度 的 检索 行为 之 间 的 量化 
映射 关系 ,实现 基于 行为 的 任务 难度 识别 和 判断 功能 ， 
以 伐 入 信息 系统 中 ,使 得 检索 系统 能 够 在 隐 性 的 用 户 
观察 中 , 既 可 以 洞察 用 户 可 能 面临 的 搜索 困境 ,及 时 提 
供 相应 的 干预 和 调节 ,也 可 以 优化 任务 分 派 机 制 ,使 用 
户 在 力所能及 的 情况 下 尽 可 能 持续 开展 并 完成 搜索 任 
5 ,避免 在 任务 困难 中 退缩 甚至 停止 。 

本 研究 的 不 足 主要 是 ,虽然 开展 多 轮 实验 进行 检 
验 ,同时 也 与 同类 研究 进行 比较 ,揭示 了 在 不 同 研究 中 
任务 难度 感知 与 检索 行为 相对 稳定 的 关系 。 但 是 ,总 
体 来 看 ,实验 研究 的 被 试 规模 比较 有 限 ,所 以 在 总 体 样 
本 代表 性 上 具有 一 定局 限 ,还 有 待 在 更 大 规模 的 搜索 
情境 下 进行 检验 。 同 时 ,大 多 数 实验 室 研究 的 任务 设 
计 来 自 研 究 主 试 布置 ,距离 用 户 真实 任务 还 有 一 定 距 
离 , 所 以 后 续 可 结合 日 志 数 据 进 行 比 对 和 印证 ,可 以 更 
好 地 检验 本 研究 所 提取 的 行为 指标 对 于 判断 用 户 任 务 
难度 感知 作用 的 普 适 性 。 此 外 ,在 行为 指标 方面 , 现 有 
指标 均 为 检索 过 程 的 累积 结果 ,对 于 检索 过 程 的 实时 
难度 感知 反映 不 足 , 不 同 指标 在 区 分 困难 感知 程度 上 
的 差异 也 并 未 考虑 ,后 续 可 对 搜索 过 程 中 的 任务 难度 
感知 及 其 变化 进行 更 细 粒 度 研究 ,以 及 对 与 检索 行为 
相关 的 规律 进行 更 深入 地 探索 。 同 时 ,可 以 结合 眼 动 、 
表情 以 及 日 志 等 更 丰富 的 可 观测 数据 ,为 任务 难度 分 


析 提 供 支 持 , 促 进 信 息 检索 系统 对 用 户 搜 索 认 知 、 情 感 
状态 的 捕捉 ,提升 用 户 检索 绩效 和 体验 。 
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Research on the Search Behaviors Oriented to Task Difficulty Perception 
Huang Kun' Chen Jiaqi Liu Chang 
! School of Government, Beijing Normal University, Beijing 100875 

* Department of Information Management, Peking University, Beijing 100871 
Abstract: | Purpose/significance | This study uses learning-related search as the background to explore interac- 
tive behavior indicators that have a stable and significant impact on users’ perception of the task difficulty. | Meth- 
od/process | This research relied on course teaching to carry out behavior experiments. It took Information Technolo- 
gy Application course students as the research objects, used Morae to record search behavior experiments remotely. A 
"total of 170 valid search behavior records from 39 students have been collected. According to the screen recording da- 
Cjand the task difficulty perception evaluation data, this study analyzed the behavior indicators which show signifi- 
Aht differences under different difficulty levels. In addition , this study also combined two experimental data that car- 
d out by the research team in 2016 and 2017 and the findings of existing related research, horizontal comparison 
Gs made, so as to summarize the stability of significant differences of behavior indicators under different task diffi- 
ey levels. | Result/conclusion | Finally, a stable behavior indicator system with 26 behavior indicators is ob- 
ned. The research also describes users" behavior characteristics in difficult tasks from the perspective of explorato- 

@yjsearch process and behavior types, and points out the future research directions. 
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《图 书 情报 工作 》 投 稿 作者 学 术 诚 信 声 明 


| 

| 《图 书 情报 工作 》 一 直 秉 持 发 表 优秀 学 术 论 文成 果 、 促 进 业 界 学 术 交 流 的 使 命 ,并 致力 于 净化 学 术 出 版 环境 , 创 
: 建 良 好 学 术 生 态 。2013 年 牵头 制订 发布 并 开始 执行 《图 书馆 学 期 刊 关于 恪守 学 术 道 德 净化 学 术 环 境 的 联合 声明 》 
| (简称 《声明 》) (JL : http :Z/ www. lis. ac. cn/CN/ column/item202. shtml ) ,随后 又 牵头 制订 并 发 布 ( 中 国 图 书馆 学 情报 
E 


学 期 刊 抵制 学 术 不 端 联合 行动 计划 》( 简称 4 联合 行动 计划 》)( 见 : http://www. lis. ac. en/CN/column/ item247 . sht- 
ml) 。 为 贯彻 和 落实 这 一 理念 ,本 刊 郑重 声明 ,即日 起 ,所 有 投稿 作者 须 承 诺 : 投 稿 本 刊 的 论文 , 须 遵 守 以 上 《声明 》 
及 《联合 行动 计划 》, 自 觉 坚 守 学 术 道德 ,坚决 抵制 学 术 不 端 。《 图 书 情报 工作 》 对 一 切 涉嫌 抄袭 、 员 窃 等 各 种 学 术 不 
端 行为 的 论文 实行 零 容 忍 ,并 采取 相应 的 惩戒 手段 。 
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